智能论文笔记

Understanding reinforcement learned crowds

Ariel Kwiatkowski , Vicky Kalogeiton , Julien Pettré , Marie-Paule Cani

分类：机器学习 | 人工智能

2022-09-19

模拟虚拟人群的轨迹是计算机图形中通常遇到的任务。最近的一些作品应用了强化学习方法来使虚拟代理动画，但是在基本模拟设置方面，它们通常会做出不同的设计选择。这些选择中的每一个都有合理的使用依据，因此并不明显其真正的影响是什么，以及它们如何影响结果。在这项工作中，我们从对学习绩效的影响以及根据能源效率测得的模拟的质量分析了其中一些任意选择。我们对奖励函数设计的性质进行理论分析，并经验评估使用某些观察和动作空间对各种情况的影响，并将奖励函数和能量使用作为指标。我们表明，直接使用相邻代理的信息作为观察，通常优于更广泛使用的射线播放。同样，与具有绝对观察结果的自动对照相比，使用具有以自我为中心的观察的非体力学对照倾向于产生更有效的行为。这些选择中的每一个都对结果产生重大且潜在的非平凡影响，因此研究人员应该注意选择和报告他们的工作。

translated by 谷歌翻译

Robots Enact Malignant Stereotypes

Andrew Hundt , William Agnew , Vicky Zeng , Severin Kacianka , Matthew Gombolay

分类：机器人 | 人工智能 | 计算机视觉 | 机器学习

2022-07-23

刻板印象，偏见和歧视已在机器学习（ML）方法（例如计算机视觉（CV）[18，80]，自然语言处理（NLP）[6]或两者兼有大图像和大图像和两者兼而有之）标题模型，例如OpenAI剪辑[14]。在本文中，我们评估了ML偏差如何在世界内部和自主作用的机器人中表现出来。我们审核了最近发表的几种剪贴式机器人操纵方法之一，向其呈现在表面上有人脸的图片，这些物体在种族和性别之间各不相同，以及包含与常见刻板印象相关的术语的任务说明。我们的实验明确表明机器人对性别，种族和科学持有的较大的构成观念的作用，并大规模地划分了。此外，经过审核的方法不太可能认识有色人种和有色人种。我们的跨学科社会技术分析跨越了科学技术与社会（STS），批判性研究，历史，安全，机器人技术和AI等领域和应用。我们发现，由大型数据集和溶解模型提供动力的机器人（有时称为“基础模型”，例如剪辑），其中包含人类风险在物理上放大恶性刻板印象；而且，仅纠正差异将不足以使问题的复杂性和规模不足。取而代之的是，我们建议机器人学习方法在适当的时候暂停，重新设计甚至损坏，直到结果被证明是安全，有效和公正的，才能暂停，重新工作甚至损坏其他有害结果。最后，我们讨论了有关身份安全评估框架和设计正义等主题的新的跨学科研究的全面政策变化，以及更好地理解和解决这些危害的主题。

translated by 谷歌翻译

Assessing the Performance of Automated Prediction and Ranking of Patient Age from Chest X-rays Against Clinicians

Matthew MacPherson , Keerthini Muthuswamy , Ashik Amlani , Charles Hutchinson , Vicky Goh , Giovanni Montana

分类：计算机视觉 | 机器学习

2022-07-04

了解伴随衰老过程的内部生理变化是医学图像解释的重要方面，预期的变化在报告异常发现时起着基线的作用。最近已经证明了深度学习可以准确地从胸部X射线检查患者年龄，并显示出作为健康指标和死亡率预测因素的潜力。在本文中，我们介绍了一项关于放射科医生与最先进的深度学习模型的相对性能的新型比较研究：（a）单个胸部X射线的患者年龄估计，以及（b）排名同一患者的两个时间分离图像。我们使用一个具有1.8m胸部X射线的异质数据库培训模型，其地面真相患者年龄，并研究了有限的培训数据和图像分辨率对模型准确性的限制，并在公共数据上证明了概括性的性能。为了探索模型与人类之间在这些年龄预测任务上的较大性能差距，与文献中看到的其他放射学报告任务相比，我们将我们的年龄预测模型纳入有条件的生成对抗网络（CGAN），允许可视化确定的语义特征通过预测模型对年龄预测很重要，将确定的特征与临床医生依赖的特征进行比较。

translated by 谷歌翻译

Mathematical model bridges disparate timescales of lifelong learning

Mingzhen Lu , Tyler Marghetis , Vicky Chuqiao Yang

分类：机器学习

2022-06-08

终身学习发生在几分钟到几十年的时间尺度上。人们可以在新技能上失去自己，练习几个小时，直到精疲力尽。他们可以在几天或几十年的时间里掌握掌握，也许完全放弃了旧技能，以寻求新的挑战。对学习的充分理解需要一个整合这些时间尺度的帐户。在这里，我们提出了一个最小的定量模型，该模型统一了学习的嵌套时间尺度。我们的动态模型恢复了技能获取的经典记载，并描述了学习如何从动机，疲劳和工作的动力学动态出现，同时也位于技能选择，精通和遗弃的长期动态中。我们应用此模型来探索各种培训制度的好处和陷阱，并表征动机和技能发展方面的个体差异。我们的模型连接以前不同的时间尺度 - 以及通常在每个时间范围内孤立研究的子学科，以提供有关技能获取时间的统一说明。

translated by 谷歌翻译

Active Learning for Computationally Efficient Distribution of Binary Evolution Simulations

Kyle Akira Rocha , Jeff J. Andrews , Christopher P. L. Berry , Zoheyr Doctor , Pablo Marchant , Vicky Kalogera , Scott Coughlin , Simone S. Bavera , Aaron Dotter , Tassos Fragos

分类：机器学习

2022-03-30

二进制恒星经历各种相互作用和进化阶段，对于预测和解释观察到的特性至关重要。具有完整恒星结构和进化模拟的二元种群合成在计算上需要大量的质量转移序列。最近开发的二元种群综合代码Posydon结合了梅萨二元星模拟的网格，然后将其插值以模拟大型大型二进制文件。计算高密度直线网格的传统方法对于高维网格，不可扩展，这是一系列金属性，旋转和偏心率的范围。我们提出了一种新的活跃学习算法PSY-CRI，该算法使用数据收集过程中的机器学习来适应和迭代选择目标模拟以运行，从而导致自定义，高性能的训练集。我们在玩具问题上测试PSY-CRIS，发现所得的训练集比常规或随机采样网格所需的模拟更少以进行准确的分类和回归。我们进一步将psy-cris应用于构建Mesa模拟动态网格的目标问题，我们证明，即使没有微调，仅$ \ sim 1/4 $的模拟集也足以足以达到相同的分类精度。当针对目标应用程序优化算法参数时，我们预计将进一步增益。我们发现，仅对分类进行优化可能会导致回归中的绩效损失，反之亦然。降低产生网格的计算成本将使Posydon的未来版本涵盖更多的输入参数，同时保留插值精度。

translated by 谷歌翻译

Visual Identification of Articulated Object Parts

Vicky Zeng , Timothy E. Lee , Jacky Liang , Oliver Kroemer

分类：机器人

2020-12-01

作为自治机器人的互动和导航在诸如房屋之类的真实环境中，可靠地识别和操纵铰接物体，例如门和橱柜是有用的。在对象铰接识别中许多先前的作品需要通过机器人或人类操纵物体。虽然最近的作品已经解决了从视觉观测的预测，但他们经常假设根据其运动约束的铰接部件移动的类别级运动模型或观察序列的先验知识。在这项工作中，我们提出了Formnet，是一种神经网络，该神经网络识别来自RGB-D图像和分段掩模的单帧对象部分的对象部分之间的铰接机制。从6个类别的149个铰接对象的100K合成图像培训网络培训。通过具有域随机化的光保护模拟器呈现合成图像。我们所提出的模型预测物体部件的运动残余流动，并且这些流量用于确定铰接类型和参数。该网络在训练有素的类别中的新对象实例上实现了82.5％的铰接式分类精度。实验还展示了该方法如何实现新颖类别的泛化，并且在没有微调的情况下应用于现实世界图像。

translated by 谷歌翻译